Clustering Spectral semi-supervisé avec propagation automatique des contraintes par paires
نویسندگان
چکیده
In our data driven world, clustering is of major importance to help end-users and decision makers understanding information structures. Supervised learning techniques rely on ground truth to perform the classification and are usually subject to overtraining issues. On the other hand, unsupervised clustering techniques study the structure of the data without disposing of any training data. Given the difficulty of the task, unsupervised learning tends to provide inferior results to supervised learning. To boost their performance, a compromise is to use learning only for some of the ambiguous classes or objects. In this context, this paper studies the impact of pairwise constraints to unsupervised Spectral Clustering. We introduce a new generalization of constraint propagation which maximizes partitioning quality while reducing annotation costs. MOTS-CLÉS : Clustering Spectral, apprentissage semi-supervisé, classification vidéo.
منابع مشابه
Clustering par apprentissage de distance guidé par des préférences sur les attributs
Résumé. Ces dernières années de nombreuses méthodes semi-supervisées de clustering ont intégré des contraintes entre paires d’objets ou d’étiquettes de classe, afin que le partitionnement final soit en accord avec les besoins de l’utilisateur. Pourtant dans certains cas où les dimensions d’études sont clairement définies, il semble opportun de pouvoir directement exprimer des contraintes sur le...
متن کاملSLEMC : Apprentissage semi-supervisé enrichi par de multiples clusterings
Résumé. La tâche de classification supervisée consiste à induire un modèle de prédiction en utilisant un ensemble d’échantillons étiquetés. La précision du modèle augmente généralement avec le nombre d’échantillons disponibles. Au contraire, lorsque seuls quelques échantillons sont disponibles pour l’apprentissage, le modèle qui en résulte donne généralement des résultats médiocres. Malheureuse...
متن کاملKhiops: outil d'apprentissage supervisé automatique pour la fouille de grandes bases de données multi-tables
Résumé. Khiops est un outil d’apprentissage supervisé automatique pour la fouille de grandes bases de données multi-tables. L’importance prédictive des variables est évaluée au moyen de modèles de discrétisation dans le cas numérique et de groupement de valeurs dans le cas catégoriel. Dans le cas d’une base multi-tables, par exemple des clients avec leurs achats, une table d’analyse individus ×...
متن کاملSemi-supervised incremental clustering of categorical data
Résumé. Le clustering semi-supervisé combine l’apprentissage supervisé and non-supervisé pour produire meilleurs clusterings. Dans la phase initiale supervisée de l’algorithme, un échantillon d’apprentissage est produit par selection aléatoire. On suppose que les exemples de l’échantillon d’apprentissage sont étiquetés par un attribut de classe. Puis, un algorithme incrémentiel développé pour l...
متن کاملComparaison de BTD avec des stratégies d ’ exploration “ intelligentes ” pour une sélection automatique d ’ algorithmes
Nous considérons un solveur générique de problèmes de satisfaction de contraintes (CSP) binaires, paramétré par des choix de haut niveau, à savoir le type de recherche, le niveau de propagation de contraintes et l’heuristique de choix de variables. Nous comparons expérimentalement 18 configurations de ce solveur générique sur plus d’un millier d’instances. Un premier but est de comprendre la co...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2015